查看原文
其他

神级程序员Fabrice Bellard发布音频压缩工具TSAC:底层采用Transformer模型、算力要求高

FFmpeg 之父 Fabrice Bellard 朴实无华的个人主页增加了一个新项目——音频压缩工具 TSAC,可对音频的比特率进行极低压缩。
根据介绍,对于 44.1 kHz 的音频,TSAC 可将其压缩至 5.5 kb/s (单声道)或 7.5 kb/s (立体声)—— 并确保提供可感知的 “良好” 质量。
此外还可将一首 3.5 分钟的立体声乐曲压缩至 192 KiB。

    下面感受一波 TSAC 缩效果:

    original(原始音频)

    stereo 7.26 kb/s(立体声)

    mono 5.61 kb/s(单声道)

    stereo 2.99 kb/s(立体声)

    Fabrice Bellard 表示,TSAC 基于针对立体声扩展的 Descript Audio Codec 的修改版本和 Transformer 模型,以进一步提高压缩比。两种模型均量化为每个参数 8 位。

    由于 TSAC 需要大量的计算能力如果希望快速运行推荐使用英伟达 GPU,当然也支持 CPU,但速度较慢。



    Fabrice Bellard 是法国计算机程序员,以编写FFmpeg,QEMU和Tiny C编译器而闻名。他开发了Bellard公式来计算pi的位数。2012年,贝拉德(Bellard)与弗兰克·斯皮内利(Franck Spinelli)共同创立了一家电信公司Amarisoft。

    1972年出生,17岁创建了可执行的压缩器LZEXE。

    1996年他编写了一个简洁但是完整的C编译器和一个Java虚拟机Harissa。

    1997年,他发现了一个新的,更快的公式计算pi的位数。

    1998年编写了一个简洁的OpenGL实现TinyGL。

    2000年开发FFMPEG。

    2002年,他开发了TinyGL,这是适用于嵌入式环境的OpenGL的子集。

    2003年开发了Emacs克隆QEmacs。

    2003年发明QEMU 通用机器仿真器和虚拟器。

    2004年,他编写了TinyCC引导加载程序,该加载程序可以在15秒内从源代码编译并引导Linux内核。

    2005年,他设计了一种系统,该系统可以通过直接从标准PC和VGA卡生成VHF信号来充当模拟或DVB-T数字电视发射机。

    2011年,他创建了一个用纯JavaScript编写的最小PC模拟器。该仿真硬件包括一个32位x86兼容CPU,一个8259可编程中断控制器,一个8254可编程中断定时器和一个16450 UART。

    2009年,他在计算pi的过程中创下了世界纪录,在90天内将其计算为将近2.7万亿个位。Slashdot写道:“虽然改进似乎很小,但它是一项了不起的成就,因为只使用了价格低于3,000美元的一台台式机,而不是以前记录中的数百万美元的超级计算机。

    2011年,他获得了O'Reilly开源奖。

    2014年,他提出了更好的便携式图形(BPG)图像格式,以替代JPEG。

    2019年7月,他发布了QuickJS,这是一个小型且可嵌入的Javascript引擎。

    最后再看看让众人膜拜的 Fabrice Bellard 个人主页:

    https://bellard.org/

    关链接

    https://bellard.org/tsac/

    https://hydrogenaud.io/index.php/topic,125765


    热门文章

    德国政府“又”从Windows迁移到Linux

    某开源公司实习生上班时间向其他开源项目提交PR,CEO发现后要求关闭

    JetBrains全家桶2024首个大版本更新

    从C++切换到Rust,开发效率提升两倍不止

    iOS版Firefox充斥着大量 “屎山代码”

    ⬇️ 长按二维码,启动!
    继续滑动看下一个
    向上滑动看下一个

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存